Telegram Group & Telegram Channel
Как можно визуализировать многомерные данные в 2D?

Существует несколько методов. Вот наиболее распространённые:

▪️Метод главных компонент (PCA)
Позволяет не только понизить размерность, но выявить наиболее информативные признаки в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной. Такие вектора называются главными компонентами и они определяют направления наибольшей изменчивости (информативности) данных. Именно эти главные компоненты можно визуализировать в 2D.

▫️Стохастическое вложение соседей с t-распределением (t-SNE)
Это техника нелинейного снижения размерности, хорошо подходящая для вложения данных высокой размерности для визуализации в пространство низкой размерности (двух- или трёхмерное). Метод моделирует каждый объект высокой размерности двух- или трёхмерной точкой таким образом, что похожие объекты моделируются близко расположенными точками, а непохожие точки моделируются точками, далеко друг от друга отстоящими.

#предобработка_данных



tg-me.com/ds_interview_lib/330
Create:
Last Update:

Как можно визуализировать многомерные данные в 2D?

Существует несколько методов. Вот наиболее распространённые:

▪️Метод главных компонент (PCA)
Позволяет не только понизить размерность, но выявить наиболее информативные признаки в данных. Его суть заключается в предположении о линейности отношений данных и их проекции на подпространство ортогональных векторов, в которых дисперсия будет максимальной. Такие вектора называются главными компонентами и они определяют направления наибольшей изменчивости (информативности) данных. Именно эти главные компоненты можно визуализировать в 2D.

▫️Стохастическое вложение соседей с t-распределением (t-SNE)
Это техника нелинейного снижения размерности, хорошо подходящая для вложения данных высокой размерности для визуализации в пространство низкой размерности (двух- или трёхмерное). Метод моделирует каждый объект высокой размерности двух- или трёхмерной точкой таким образом, что похожие объекты моделируются близко расположенными точками, а непохожие точки моделируются точками, далеко друг от друга отстоящими.

#предобработка_данных

BY Библиотека собеса по Data Science | вопросы с собеседований


Warning: Undefined variable $i in /var/www/tg-me/post.php on line 283

Share with your friend now:
tg-me.com/ds_interview_lib/330

View MORE
Open in Telegram


Библиотека собеса по Data Science | вопросы с собеседований Telegram | DID YOU KNOW?

Date: |

The STAR Market, as is implied by the name, is heavily geared toward smaller innovative tech companies, in particular those engaged in strategically important fields, such as biopharmaceuticals, 5G technology, semiconductors, and new energy. The STAR Market currently has 340 listed securities. The STAR Market is seen as important for China’s high-tech and emerging industries, providing a space for smaller companies to raise capital in China. This is especially significant for technology companies that may be viewed with suspicion on overseas stock exchanges.

If riding a bucking bronco is your idea of fun, you’re going to love what the stock market has in store. Consider this past week’s ride a preview.The week’s action didn’t look like much, if you didn’t know better. The Dow Jones Industrial Average rose 213.12 points or 0.6%, while the S&P 500 advanced 0.5%, and the Nasdaq Composite ended little changed.

Библиотека собеса по Data Science | вопросы с собеседований from ru


Telegram Библиотека собеса по Data Science | вопросы с собеседований
FROM USA